Nội dung cơ sở dữ liệu Mạng từ

Ví dụ mục từ "Hamburger" trong Mạng từ

Cho đến tháng 11 năm 2012, phiên bản trực tuyến mới nhất của Mạng từ là 3.1 [2]. Cơ sở dữ liệu bao gồm 155.287 từ được tổ chức thành 117.659 loạt đồng nghĩa với tổng số 206.941 cặp nghĩa-từ; ở dạng nén, nó khoảng 12 megabytes.[3]

Mạng từ bao gồm các phạm trù từ vựng danh từ, động từ, tính từ và trạng từ và bỏ qua giới từ, hạn định từ và các từ chức năng khác. 

Các từ thuộc cùng một phạm trù từ vựng đồng nghĩa tương đối với nhau được nhóm lại thành loạt đồng nghĩa. Loạt đồng nghĩa bao gồm các từ đơn cũng như các tổ hợp như "eat out" (ăn ở ngoài) và "car pool" (nhóm đi chung xe). Các nghĩa khác nhau của từ đa nghĩa được quy gán cho các loạt đồng nghĩa khác nhau. Nghĩa của một loạt đồng nghĩa được làm rõ hơn nhờ một chú giải xác định ngắn gọn và một hay hơn một ví dụ cách sử dụng. Một loạt đồng nghĩa tính từ điển hình như sau:

good, right, ripe – (most suitable or right for a particular purpose; "a good time to plant tomatoes"; "the right time to act"; "the time is ripe for great sociological changes")

Tất cả các loạt đồng nghĩa được kết nối với các loạt đồng nghĩa khác nhờ các quan hệ ngữ nghĩa. Những mối quan hệ này, không giống nhau ở tất cả các phạm trù từ vựng, bao gồm: 

  • Danh từ
    • bao: Y là bao của X nếu mọi X là (một loại của) Y (canine (họ Chó) là bao của dog (chó)) 
    • thuộc: Y là thuộc của X nếu mọi Y là (một loại của) X (dog (chó) là thuộc của canine (họ Chó)) 
    • thuật ngữ ngang hàng: Y là thuật ngữ ngang hàng của X nếu X và Y cùng chung một từ bao (wolf (chó sói) là thuật ngữ ngang hàng của dog (chó), và dog (chó) là thuật ngữ ngang hàng của wolf (chó sói)) 
    • phân: Y là phân của X nếu Y là một phần của X (window (cửa sổ) là phân của building (toà nhà)) 
    • tổng: Y là tổng của X nếu X là một phần của Y (building (toà nhà) là tổng của window (cửa sổ)) 
  • Động từ
    • bao: động từ Y là bao của động từ X nếu hành động X là (một loại của) Y (to perceive (nhận thức) là bao của to listen (nghe)) 
    • cách: động từ Y là cách của động từ X nếu hành động Y thực hiện X theo một cách nào đó (to lisp (nói ngọng) là cách của to talk (nói)) 
    • suy ra: động từ Y được suy ra từ X nếu khi thực hiện X bạn phải thực hiện Y (to sleep (ngủ) được suy ra từ to snore (ngáy)) 
    • thuật ngữ ngang hàng: những động từ này có chung từ bao (to lisp (nói ngọng) và to yell (la hét)) 

Những quan hệ ngữ nghĩa này diễn ra giữa các thành viên của các loạt đồng nghĩa có kết nối với nhau. Các thành viên của loạt đồng nghĩa đơn lẻ (các từ) cũng có thể được nối kết với các quan hệ ngữ nghĩa. Chẳng hạn, (một nghĩa của) danh từ "director" (người điều khiển, người chỉ huy) được nối với (một nghĩa của) động từ "direct" (điều khiển, chỉ huy) từ chỗ nó bắt nguồn thông qua một đường kết nối hình thái ngữ nghĩa 

Các chức năng hình thái học của phần mềm phân phối dữ liệu cố gắng truy tìm (deduce) thân từ (lemma) hay gốc từ (stem) của một từ từ sự nhập liệu của người sử dụng. Các dạng thức bất quy tắc được lưu thành một danh sách, và khi tra từ "ate" (ăn) sẽ được dẫn tới "eat" (ăn), chẳng hạn.

Tài liệu tham khảo

WikiPedia: Mạng từ http://www.babylon.com/free-dictionaries/reference... //edwardbetts.com/find_link?q=M%E1%BA%A1ng_t%E1%BB... http://wordnet.princeton.edu/ http://wordnet.princeton.edu/wordnet/man/wnstats.7... http://www.phmartin.info http://www.lingoes.net/en/dictionary/dict_down.php... http://sourceforge.net/projects/goldendict/files/d... http://web.archive.org/web/20111021114613/http://w... http://arxiv.org/pdf/1404.5372 http://www.globalwordnet.org/gwa/wordnet_table.htm...